home *** CD-ROM | disk | FTP | other *** search
/ Columbia Kermit / kermit.zip / newsgroups / misc.20000824-20010305 / 000087_news@columbia.edu _Tue Oct 24 11:39:54 2000.msg < prev    next >
Internet Message Format  |  2020-01-01  |  4KB

  1. Return-Path: <news@columbia.edu>
  2. Received: from watsun.cc.columbia.edu (watsun.cc.columbia.edu [128.59.39.2])
  3.     by fozimane.cc.columbia.edu (8.9.3/8.9.3) with ESMTP id LAA02071
  4.     for <kermit.misc@cpunix.cc.columbia.edu>; Tue, 24 Oct 2000 11:39:54 -0400 (EDT)
  5. Received: from newsmaster.cc.columbia.edu (newsmaster.cc.columbia.edu [128.59.59.30])
  6.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id LAA13162
  7.     for <kermit.misc@watsun.cc.columbia.edu>; Tue, 24 Oct 2000 11:39:53 -0400 (EDT)
  8. Received: (from news@localhost)
  9.     by newsmaster.cc.columbia.edu (8.9.3/8.9.3) id LAA13410
  10.     for kermit.misc@watsun.cc.columbia.edu; Tue, 24 Oct 2000 11:15:49 -0400 (EDT)
  11. X-Authentication-Warning: newsmaster.cc.columbia.edu: news set sender to <news> using -f
  12. From: fdc@columbia.edu (Frank da Cruz)
  13. Subject: Re: How to convert US EBCDIC -> CP850 ?
  14. Date: 24 Oct 2000 15:15:47 GMT
  15. Organization: Columbia University
  16. Message-ID: <8t4933$d30$1@newsmaster.cc.columbia.edu>
  17. To: kermit.misc@columbia.edu
  18.  
  19. "ralf.strandell" <ralf.strandell@silja.com> wrote:
  20. : We need to convert files from "us ebcdic" to cp850.
  21. :
  22. : These files contain mostly names with accented characters.
  23. :
  24. Which means they are not "US EBCDIC" but one of the "other"
  25. EBCDICs (see below).
  26.  
  27. : Unfortunately those files come from as/400 as "us ebcdic".
  28. : (they should be "finnish ebcdic", or swedish, but this cannot be 
  29. : changed without reinstalling the system...)
  30. :
  31. How were the files transferred?  Why do you think the encoding
  32. was changed?  And if the encoding *was* changed to US EBCDIC,
  33. what happened to the accented letters?
  34.  
  35. : Now we need a way to convert them either to dos cp850
  36. : or unix 7 bit swedish, either by using "translate" or by
  37. : using any script/program.
  38. :
  39. : Can you help?
  40. :
  41. Sort of...  C-Kermit and K95 do indeed have a TRANSLATE command,
  42. but it only works for character-sets that are found on platforms
  43. where these programs run, none of which are EBCDIC-based.
  44.  
  45. In fact, all the character sets known to C-Kermit and K95 are
  46. either ASCII-based (ASCII, ISO 646, ISO 8859, and various
  47. proprietary 8-bit sets that have ASCII as their lower half), or
  48. else Unicode / ISO 10646.  The proprietary sets include the many
  49. PC and Windows code pages (CP437, CP850, CP852, CP1252, etc).
  50.  
  51. In the EBCDIC (IBM mainframe) world, there is a similar
  52. proliferation of code pages, called Country Extended Code Pages
  53. (CECP), including:
  54.  
  55.   CECP 037 (Original USA EBCDIC)
  56.   CECP 237 (Germany)
  57.   CECP 238 (Finland and Sweden)
  58.   CECP 280 (Italy)
  59.   CECP 284 (Spain and Latin America)
  60.   CECP 285 (UK)
  61.   CECP 297 (France)
  62.   CECP 424 (Israel)
  63.   CECP 500 (West European Multilingual)
  64.   CECP 870 (East European Multilingual)
  65.   CECP 871 (Iceland)
  66.   CECP 875 (Greece)
  67.   CECP1025 (Cyrillic)
  68.   CECP1026 (Turkish)
  69.   CECP1046 (Arabic)
  70.   CECP1112 (Baltic)
  71.   CECP1122 (Estonia)
  72.   CECP1123 (Ukraine)
  73.  
  74. Most of these are known to IBM Mainframe Kermit.  So if you have your
  75. source files were on an IBM mainframe, you could use IBM Mainframe Kermit 
  76. to send them to C-Kermit, Kermit 95, or MS-DOS Kermit to obtain the needed
  77. translations.  Of course, you would first have to figure out which of
  78. these CECPs is actually used for your files.
  79.  
  80. But you don't have an IBM mainframe, you have an AS/400.  That's a pity,
  81. because this is one of the very few platforms for which a Kermit program
  82. was never written (volunteers???)
  83.  
  84. So one method is to move the files (without translation or conversion)
  85. from the AS/400 to an IBM Mainframe, and then use IBM Mainframe Kermit
  86. to transfer them to the target computer, using on the mainframe:
  87.  
  88.   set file character-set cp???  
  89.   set transfer character-set latin1
  90.  
  91. and on the receiving computer:
  92.  
  93.   set file character-set cp850
  94.  
  95. If you can't do that, then Kermit can't help, in which case further
  96. advice would depend on what the target platform is:  Windows, UNIX, DOS?
  97.  
  98. In UNIX, for example, maybe you could use the iconv or recode utilities
  99. (if your computer has them, and if they support the source character set),
  100. or you could build your own translation table and run the files through
  101. the tr program.  Depending on how the files were transferred, you might
  102. also need some kind of record-format conversion.
  103.  
  104. - Frank